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Herr Professor Dr. Wolf-Georg Forssmann in Hannover/Deutschland hat 
eine Patentanmeldung unter der Bezeichnung 

"Serin-Proteinase-lnhibitoren" 

am 8. Januar 1998 beim Deutschen Patent- und Markenamt eingereicht. 

Die angehefteten Stucke sind eine richtige und genaue Wiedergabe der ursprung- 
lichen Unterlagen dieser Patentanmeldung, 

Die Anmeldung hat im Deutschen Patent- und Markenamt vorlaufig die Symbole 
C 07 K, A 61 K und C 12 N der International Patentklassifikation erhalten. 

Munchen, den 1 5. Januar 1 999 
Deutsches Patent- und Markenamt 
Der President 
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Serin- Proteinase -Inhibitor en 

Die Erfindung -betrifft Serin-Proteinase-Inhibitoren, cDNA 
kodierend fur Serin- Proteinase -Inhibitoren, Arzneimittel 
enthaltend die Inhibitoren oder deren codierende Nuclein- 
saure, Ve.rwendungen der erf indungsgemaSen Verbindungen zur 
Herstellung von Arzneimitteln zur Behandlung verschiedener 
Indikationen, Antikorper oder Antikorperf ragmente gegen 
Epitope der erf indungsgemaSen Verbindungen, Poly- oder 
Oligonucleotide, die mit Genen der erf indungsgemaSen Ver- 
bindungen hybridisieren, ein Diagnostikum zum Aufspiiren der 
erf indungsgemaSen Verbindungen, sowie Arzneimittel enthaltend 
Antikorper oder Poly- oder Oligonucleotide gemaS der Er- 
findung . 

Proteolytische Prozesse spielen in alien Organismen eine 
bedeutende physiologische Rolle, wobei zwischen un- 
spezifischen und spezif ischen proteolytischen Reaktionen zu 
unterscheiden ist. Zu den ersten gehoren beispielsweise der 
Nahrungsauf schluS im Verdauungstrakt durch Endopept idasen 
sowie de.r intrazellulare Abbau verbrauchter endogener 
Substanzen und phagozyt ierten Materials durch lysosomale 
Proteinasen. Spezifische Proteolysen dienen meistens der 
Uberfuhrung eines Proenzyms in die aktive Form wie bei der 
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Uberf uhrung von Trypsinogen in Trypsin und Chymotrypsinogen 
in Chymotrypsin sowie bei den Kallikrein-Kinin-Kaskaden und 
der Blutgerinnungskaskade . Je nach Beschaf f enheit des re- 
aktiven Zentrums der daran beteiligten Proteinasen werden 
diese in die Klassen der Serin-Proteinasen (z.B. Chymo- 
trypsin, Trypsin, Elastase und Kathepsin G) , der Aspartat- 
Proteinasen (z.B. Kathepsin D, Kathepsin E und Pepsin) , der 
Cystein-Proteinasen (z.B. Kathepsin B, Kathepsin H und 
Kathepsin L.) und der Metallo-Proteinasen (z.B. Kollagenase 
und Thermolysin) unterteilt . 

Urn die oft kaskadenartig verlaufenden proteolytischen 
Prozesse gegenregulieren zu konnen, verfugt der Organismus 
iiber eine Reihe von anderen Proteinen, den Proteinase -Inhibi- 
toren (zur Ubersicht siehe Laskowski und Kato, 1980 und Bode 
und Huber, 1992). So schiitzen die in der Leber syntheti- 
sierten, humanen Plasma- Proteinase - Inhibitoren a^-Antichymo- 
trypsin und a^-Proteinase- Inhibitoren das Lungengewebe vor 
unspezif ischem Angriff durch die Proteinasen Kathepsin G bzw. 
Elastase aus polymorphkernigen Lymphozyten . Bei einem Un- 
gleichgewicht zwischen Proteinasen und ihren spezifischen 
Inhibitoren kann es zum Auftreten pathologischer Effekte 
kommen. Ein iibermaSiges Verhaltnis von Elastase zu o^- 
Proteinase- Inhibitor erhoht beispielsweise bei Patient en mit 
genetisch bedingtem Mangel an diesem Faktor das Risiko der 
Bildung eines Lungenemphysems um ca. 20 bis 30fach gegenuber 
der Normalbevolkerung (Carrel und Owen, 1980) . Bei Rauchern 
wird die Emphysembildung mittels Oxidation der im reaktiven 
Zentrum des ^-Proteinase- Inhibitors befindlichen Aminosaure 
Methionin durch im Zigarettenrauch enthaltene Oxidantien 
begiinstigt (Miller und Kuschner, 1969; Ohlsson et al . , 1980) . 
Auch im Falle der Infektion mit Gram-negativen Bakterien 
konnen deren Endotoxine eine Desintegrat ion von Phagozyten 
und damit die Ausschiittung lysosomaler Proteinasen verur- 
sachen, was durch den erhohten Verbrauch an Proteinase- 
Inhibitoren unkontrollierte Gewebsschadigung und Entziindungen 
verursachen kann. Aus diesem Grund besitzen bestimmte 



Proteinase- Inhibitoren ein hohes therapeutisches Potential 
(siehe z.B. Fritz, 1980). 

Das der Erfindung zugrunde liegende technische Problem 
besteht darin, weitere Inhibitoren von Serin-Proteinasen zur 
Verfiigung zu stellen. Des weiteren sollten die fur die 
erf indungsgemaSen Inhibitoren kodierenden Gene bzw. cDNA zur 
Verfiigung gestellt werden. 

Spezifisches Merkmal der erf indungsgemaEen Serin-Proteinase- 
Inhibitoren ist, da£ der Serin-Proteinase- Inhibitor eine 
Domane mit vier Cysteinen aufweist und sich zwischen dem 
ersten und einem zweiten Cystein eine Sequenz von 0 bis 20 
Aminosauren befindet oder der Serin-Proteinase- Inhibitor eine 
Domane mit sechs Cysteinen aufweist und sich zwischen dem 
ersten und zweiten Cystein eine Sequenz von 7 bis 2 0 Amino- 
sauren befindet. 

Bevorzugterweise befindet sich zwischen einem ersten und 
einem zweiten Cystein eine Sequenz von 13 Aminosauren 
und/oder zwischen einem zweiten und einem dritten Cystein 
eine Sequenz von 18 Aminosauren und/oder zwischen einem 
dritten und vierten Cystein eine Sequenz von 2 Aminosauren. 

Es wird insbesondere bevorzugt , daS die Sequenz zwischen 
einem ersten und zweiten Cystein ausgewahlt wird aus 



und/oder die Sequenz zwischen einem zweiten und dritten 
Cystein ausgewahlt wird aus 



HEFQAFMKNGKLF , 
DDFKKGERDGDFI , 
SAFRPFVRNGRLG, 
KEYEKQVRNGRLF, 
SQYQNQAKNG I L F , 
NE YRKLVRNGKLA , 



AEYREQMKNGRLS oder 
DEFRSQMKNGKLI 



SEYRKSRKNGRLF , 
SEFRDQVRNGTLI, 
S E YRH YVRNGRL P , 
DEFRRLLQNGKLF , 



PQDKKFFQSLDGIMFINK , 



TRENDPIQGPDGKMHGNT , 



TRENDPVLGPDGKTHGNK , 



TREHNPVRGPDGKMHGNK , 



TRE S D P VRG PDGRMHGNK , 
TREND P I RG PDGKMHGNL , 
TRENDPIQGPDGKVHGNT , 



TRESDPVRDADGKSYNNQ oder 



TRENDPVRGPDGKTHGNK , 



TRENDPIEGLDGKIHGNT , 



TRESDPVRGPDGKTHGNK 



und/oder die Sequenz zwischen einem dritten und vierten 
Cystein ausgewahlt wird aus 

AT, AL, AM, SM oder TM . 

Besonders bevorzugt wird, da£ der erf indungsgemaSe Serin- 
Proteinase- Inhibitor einer der Formeln 
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worin R x NH 2 , eine Aminosaure oder ein Peptid mit bis zu 100 
Aminosauren ist und R 2 COOH, CONH 2 , eine Aminosaure oder ein 
Peptid mit bis zu 100 Aminosauren ist, entspricht . 

Es ist weiterhin bevorzugt, daS die Serin- Proteinase ein oder 
mehrere Disulf idbrucken aufweist. Dabei ist besonders bevor- 
zugt, daS er zwischen dem ersten und vierten Cystein und/oder 
dem zweiten und dritten Cystein eine Disulf idbrucke aufweist 
oder daE. er zwischen dem ersten und fiinf ten Cystein und/oder 



dem zweiten und vierten Cystein und/oder dem dritten und 
sechsten Cystein eine Disulf idbrucke aufweist. 

Bevorzugte Vertreter der erf indungsgemaSen Serin- Proteinase- 
Inhibitoren sind die Verbindungen HF 6479 und HF 7665 sowie 
Fragmente der Proteine VAKTI-1 und VAKTI-2 gemaS den Figuren 
1 und 2 . 

Aus den Figuren 1 bis 3 lassen sich neben der Aminosaurese- 
quenz der erf indungsgemaS bevorzugten Verbindungen auch 
weitere Inf ormationen beziiglich der cDNA, die fur die er- 
f indungsgemaSen Verbindungen kodiert, entnehmen. Insbesondere 
werden die entsprechenden Motive und Primer hybridisierenden 
Stellen angegeben . 

Die erf indungsgemaSe Verbindung HF 3479 weist eine Masse von 
6.479 Dalton auf , diejenige von HF 7665 betragt 7.665 Dalton, 
beide wurden aus Hamof iltrat aufgereinigt . 

Erf indungsgemaS beansprucht wird auch eine cDNA, kodierend 
fur die erf indungsgemaSen Verbindungen, insbesondere eine 
cDNA mit der Nucleinsauresequenz gemaS Figuren 1 bis 2 . 

Die erf indungsgemaSen Verbindungen sind als Arzneimittel 
geeignet. Gegebenenf alls werden sie zusammen mit pharma- 
zeutisch vertraglichen Tragerstof f en appliziert. 

Die erf indungsgemaSen Arzneimittel enthaltend die erf indungs- 
gemaSen Proteinase -Inhibitoren werden vorzugsweise in Mengen 
von 1 bis 100 mg/kg Korpergewicht des Patienten verabreicht . 
Als Verabreichungsf orm kommen alle galenischen Zubereitungen 
fur Peptidwirkstof f e in Frage . Die Arzneimittel enthaltend 
Nucleinsauren -gemafi der Erfindung werden vorzugsweise in 
Mengen von 0,1 bis 100 mg/kg Korpergewicht eines entsprechen- 
den Patienten verabreicht . Hier kommen als galenische Ver- 
abreichungsf ormen solche in Betracht, die zur Applikation 
von Nucleinsauren geeignet sind, ohne daS die Nucleinsauren 
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vor Erreichen des Wirkortes durch Stof f wechseleinf lusse 
unwirksam gemacht werden. Als galenische Verabreichungsform 
konnen z.B. Liposomen eingesetzt werden, in denen die 
Nucleinsauren befindlich sind. 

Die erf indungsgemaSen Verbindungen kommen insbesondere zur 
Behandlung von akuten oder chronischen Cervixentziindungen, 
Entziindungen der Bartholinschen Driisen oder anderer vaginaler 
Bereiche, Tonsillitis, Pharyngitis und Laryngitis, mit exzes- 
siver Schleimbildung verbundener akut oder chronisch entzund- 
licher Prozesse und sich daraus ergebender akuter Not- 
situationen, postoperat iver Blutungen aufgrund Hyper- 
fibrinolyse sowie zur Prophylaxe der Lungenemphysembildung 
bei a x - Proteinase - Inhibitormangel in Betracht . 

Die erf indungsgemaSen Verbindungen konnen bei Mangel an 
Serin-Proteinase-Inhibitoren verabreicht werden, um endogene 
Defizite auszugleichen . Die Nucleinsauren konnen, direkt oder 
an geeignete Vehikel gekoppelt, auch zum Einsatz in der 
Gentherapie gelangen. Als geeignete Vektoren kommen ins- 
besondere attenuierte Adenoviren, in die entsprechenden Gene 
inkorporiert werden, in Frage . 

Die erf indungsgemaSen Polypeptide, insbesondere VAKTI-I und 
VAKTI-II, konnen zur Herstellung von Antikorpern oder Anti- 
korperf ragmenten dienen. Diese werden in einfacher Weise 
durch Immunisierung geeigneter Sauger hergestellt. Durch an 
sich bekahnte Operationen konnen die Antikorper auch humani- 
siert werden, so daS diese Antikorper ebenfalls zum thera- 
peutischen Einsatz gelangen konnen. Antikorper oder Anti- 
korperf ragmente konnen dann zur Regulation von Erkrankungen 
eingesetzt werden, bei denen die Proteinase - Inhibitoren 
pathologisch exprimiert werden. Ebenso konnen zu den er- 
f indungsgemaSen Nucleinsauren komplementare Ant i sense - 
Nucleinsauren zum therapeut ischen Einsatz bei Uberexpression 
der Proteinase - Inhibitor-Genen eingesetzt werden. 




Die erf indungsgemaEen Verbindungen sind in einfacher Weise 
durch an sich bekannte Methoden der Peptid- bzw. Nucleotid- 
synthese herstellbar. Einer gentechnischen Herstellung der 
Verbindungen steht ebenfalls nichts im Wege . 

Der Fachmann erkennt, dag bei den Polypeptiden gemaS der 
Erfindung auch Fragmente verwendet werden konnen, sofern sie 
die inhibitorischen Eigenschaf ten der Serin- Proteinase- 
Inhibitoren beibehalten. Das Auffinden solcher Fragmente ist 
dem Fachmann bekannt . So erfolgt dies beispielsweise durch 
gezielte enzymatische Spaltung der erf indungsgemaSen Ver- 
bindungen. Es konnen auch in den Seitenketten modifizierte 
Aminosauren eingesetzt werden. Auch N- und C-terminal modifi- 
zierte Polypeptide kommen in Betracht . Insbesondere konnen 
phosphorylierte, glycosylierte , methylierte, acetylierte oder 
in ahnlicher Weise modifizierte Polypeptide eingesetzt 
werden, sofern sie die Wirkung der Serin-Proteinase- In- 
hibitoren nicht relevant beeintrachtigen . 

Bei den Nucleinsauren gemafi der Erfindung kommen auch 
Derivate in Betracht, die je nach Codon Usage modifizierte 
Tripletstrukturen aufweisen. Desweiteren sind als Nuclein- 
sauren gemaS der Erfindung auch solche zu verstehen, die 
durch Nucleasen gegeniiber den nativen Verbindungen weniger 
stark abgebaut werden, beispielsweise die entsprechenden 
SODN-Derivate, die in der Antisense-Technologie iiblicherweise 
eingesetzt werden, urn die Antisense-Strukturen gegeniiber 
enzymatischen Angriffen stabiler auszugestalten . 

Auch mit den Polypeptiden homologe Strukturen kommen in Be- 
tracht. Dies sind insbesondere Polypeptidstrukturen, bei 
denen Aminosauren ausgetauscht sind. So konnen beispielsweise 
konservative Aminosauresubst i tutionen in hochkonservierten 
Regionen wie folgt beriicksicht igt werden: Jede Isoleucin-, 
Valin- und Leucin-Aminosaure kann gegen eine andere dieser 
Aminosauren ausgetauscht sein, Aspartat kann gegen Glutamat 
und umgekehrt ausgetauscht sein, Glutamin gegen Asparagin 



- 8 - 

und umgekehrt, Serin gegen Trionin und umgekehrt . Kon- 
servative Aminosauresubstitutionen in weniger hochkonser- 
vierten Regionen konnen wie folgt sein: Jede der Aminosauren 
Isoleucin, Valin und Leucin gegen jede andere Aminosauren, 
Aspartat gegen Glutamat und umgekehrt, Glutamin gegen 
Asparagin und umgekehrt, Serin gegen Theonin und umgekehrt, 
Glycin gegen Alanin und umgekehrt, Alanin gegen Valin und 
umgekehrt, Methionin gegen jede der Aminosauren Leucin, 
Isoleucin oder Valin, Lysin gegen Arginin und umgekehrt, eine 
der Aminosauren Aspartat oder Glutamat gegen eine der Amino- 
sauren Arginin oder Lysin, Histidin gegen eine der Amino- 
sauren Arginin oder Lysin, Glutamin gegen Glutamat und 
umgekehrt und Asparagin gegen Aspartat und umgekehrt . 

Die Wirku'ngsweise der erf indungsgemafeen Peptide wird durch 
das f olgende Beispiel erlautert . 

Beispiel 

Messung der Proteinase Inhibition durch HF 7665 
MeSansatz : 

84 fil MeSpuffer (0,1 M HEPES, pH 7.5; 0,5 M NaCl 2 ) 

1 fil Trypsin (1 mg/ml in 1 mM HCl , 2 0 mM CaCl 2 ) 

5 fil L-BABNA (6 mg/ml Na-Benzoyl -L-Arginine-p-Nitro- 

anilide Hydrochloride) 
10 /xl Proteinase-Inhibitor (10 fxM bzw. 75 fig/ml HF 7665 

in H 2 0) . 

Die Reaktion wurde durch Zugabe des chromogenen Substrates 
gestartet und der Substratumsat z mittels Photometer bei X= 
4 05 nm verf olgt . Nach ca. fiinf Minuten wurden 10 jxl Pro- 
teinase-Inhibitor bzw. entsprechende Kontrollen dazugegeben 
und der weitere Extinkt ionsverlauf beobachtet . 



Es konnte gezeigt werden, daE HF 7665 in einer Endkonzen- 
tration von ca . 1 fxM bzw. 7,5 /xg/ml einen inhibitorischen 
Effekt auf Trypsin besitzt. Kontrollversuche mit entsprechen- 
den Mengen an BSA (7,5 fig/ml) und Acetonitril/TFA (0,8% 
ACN/0,001% TFA) zeigten keine Trypsininhibierung . Weiterhin 
konnte kein inhibitorischer Effekt von HF 7665 auf Chymo- 
trypsin bei einem ahnlichen Test beobachtet werden. 

Figur 3 zeigt, daS sich nach Zugabe von HF 7665 der 
Substratumsatz durch Trypsininhibierung urn ca . 3 0% ver- 
mindert . 




S EQUENZ PROTOKOLL 



(1) ALLGEME INE ANGABEN: 

( i ) ANMELDER : 

(A) NAME: Prof. Dr. Wolf-Georg Forssmann 

(B) STRASSE: Feodor-Lynen-Str . 31 

( C ) ORT : Hannover 

(E) LAND: Deutschland 

(F) POSTLEITZAHL: 30625 

(ii) BEZEICHNUNG DER ERFINDUNG : Serin- Proteinase- Inhibitoren 
(iii) ANZAHL DER SEQUENZEN: 34 

(iv) COMPUTER- LESBARE FAS SUNG : 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS /MS -DOS 

(D) SOFTWARE: Patentln Release #1.0, Version #1.30 (EPA) 



(2) ANGABEN ZU SEQ ID NO: 1: 

( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 177 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 1: 

Met Lys lie Ala Thr Val Ser Val Leu Leu Pro Leu Ala Leu Cys Leu 
15 10 15 

lie Gin Asp Ala Ala Ser Lys Asn Glu Asp Gin Glu Met Cys His Glu 
20 25 30 

Phe Gin Ala Phe Met Lys Asn Gly Lys Leu Phe Cys Pro Gin Asp Lys 
35 40 45 

Lys Phe Phe Gin Ser Leu Asp Gly lie Met Phe lie Asn Lys Cys Ala 
50 55 60 

Thr Cys Lys Met lie Leu Glu Lys Glu Ala Lys Ser Gin Lys Arg Ala 
65 70 75 80 

Arg His Leu Ala Arg Ala Pro Lys Ala Thr Ala Pro Thr Glu Leu Asn 
85 90 95 

Cys Asp Asp Phe Lys Lys Gly Glu Arg Asp Gly Asp Phe lie Cys Pro 
100 105 110 

Asp Tyr Tyr Glu Ala Val Cys Gly Thr Asp Gly Lys Thr Tyr Asp Asn 
115 120 125 

Arg Cys Ala Leu Cys Ala Glu Asn Ala Lys Thr Gly Ser Gin lie Gly 
130 * 135 140 

Val Lys Ser Glu Gly Glu Cys Lys Ser Ser Asn Pro Glu Gin Val Arg 
145 150 155 160 




Ser lie Val Ser Leu Met Gly Asn Thr Gly Arg Leu Thr Ser Asn Ser 
165 170 175 



Lys 



(2) ANGABEN ZU SEQ ID NO : 2: 

( i ) SEQUENZKENNZE I CHEN : 

(A) LANGE: 92 2 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM : Einzel Strang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Pep t id 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 2: 

Met Lys lie Ala Thr Val Ser Val Leu Leu Pro Leu Ala Leu Cys Leu 
1 5. 10 15 

lie Gin Asp Ala Ala Ser Lys Asn Glu Asp Gin Glu Met Cys His Glu 
20 25 30 

Phe Gin Ala Phe Met Lys Asn Gly Lys Leu Phe Cys Pro Gin Asp Lys 
35 " 40 45 

Lys Phe Phe Gin Ser Leu Asp Gly lie Met Phe lie Asn Lys Cys Ala 
50 55 60 

Thr Cys Lys Met lie Leu Glu Lys Glu Ala Lys Ser Gin Lys Arg Ala 
65 70 75 80 

Arg His Leu Ala Arg Ala Pro Lys Ala Thr Ala Pro Thr Glu Leu Asn 
85 90 95 

Cys Asp Asp Phe Lys Lys Gly Glu Arg Asp Gly Asp Phe lie Cys Pro 
100 105 110 

Asp Tyr Tyr Glu Ala Val Cys Gly Thr Asp Gly Lys Thr Tyr Asp Asn 
115 120 125 

Arg Cys Ala Leu Cys Ala Glu Asn Ala Lys Thr Gly Ser Gin lie Gly 
130 135 140 

Val Lys Ser Glu Gly Glu Cys Lys Ser Ser Asn Pro Glu Gin Asp Val 
14 5 150 155 160 

Cys Ser Ala Phe Arg Pro Phe Val Arg Asn Gly Arg Leu Gly Cys Thr 
165 170 175 

Arg Glu Asn Asp Pro Val Leu Gly Pro Asp Gly Lys Thr His Gly Asn 
180 185 190 

Lys Cys Ala Met Cys Ala Glu Leu Phe Leu Lys Glu Ala Glu Asn Ala 
195 200 205 

Lys Arg Glu Gly Glu Thr Arg lie Arg Arg Asn Ala Glu Lys Asp Phe 
210 215 220 

Cys Lys Glu Tyr Glu Lys Gin Val Arg Asn Gly Arg Leu Phe Cys Thr 
225 230 235 240 



Arg Glu Ser Asp Pro Val Arg Gly Pro Asp Gly Arg Met His Gly Asn 
245 250 255 

Lys Cys Ala Leu Cys Ala Glu lie Phe Lys Arg Arg Phe Ser Glu Glu 
260 265 270 

Asn Ser Lys Thr Asp Gin Asn Leu Gly Lys Ala Glu Glu Lys Thr Lys 
275 280 285 

Val Lys Arg Glu lie Val Lys Leu Cys Ser Gin Tyr Gin Asn Gin Ala 
290 295 300 

Lys Asn Gly lie Leu Phe Cys Thr Arg Glu Asn Asp Pro lie Arg Gly 
305 ■ 310 315 320 

Pro Asp Gly Lys Met His Gly Asn Leu Cys Ser Met Cys Gin Val Tyr 
325 330 335 

Phe Gin Ala Glu Asn Glu Glu Lys Lys Lys Ala Glu Ala Arg Ala Arg 
340 345 350 

Asn Lys Arg Glu Ser Gly Lys Ala Thr Ser Tyr Ala Glu Leu Cys Asn 
355 360 365 

Glu Tyr Arg Lys Leu Val Arg Asn Gly Lys Leu Ala Cys Thr Arg Glu 
370 375 380 

Asn Asp Pro lie Gin Gly Pro Asp Gly Lys Val His Gly Asn Thr Cys 
385 390 '395 400 

Ser Met Cys Glu Val Phe Phe Gin Ala Glu Glu Glu Glu Lys Lys Lys 
405 410 415 

Lys Glu Gly Glu S.er Arg Asn Lys Arg Gin Ser Lys Ser Thr Ala Ser 
420 425 430 

Phe Glu Glu Leu Cys Ser Glu Tyr Arg Lys Ser Arg Lys Asn Gly Arg 
435 440 445 

Leu Phe Cys' Thr Arg Glu Asn Asp Pro lie Gin Gly Pro Asp Gly Lys 
450 455 460 

Met His Gly Asn Thr Cys Ser Met Cys Glu Ala Phe Phe Gin Gin Glu 
465 470 475 480 

Glu Arg Ala Arg Ala Lys Ala Lys Arg Glu Ala Ala Lys Glu lie Cys 
485 490 495 

Ser Glu Phe Arg Asp Gin Val Arg Asn Gly Thr Leu lie Cys Thr Arg 
500 505 510 

Glu His Asn Pro Val Arg Gly Pro Asp Gly Lys Met His Gly Asn Lys 
515 520 525 

Cys Ala Met Cys Ala Ser Val Phe Lys Leu Glu Glu Glu Glu Lys Lys 
530 535 540 

Asn Asp Lys Glu Glu Lys Gly Lys Val Glu Ala Glu Lys Val Lys Arg 
545 550 555 560 

Glu Ala Val Gin Glu Leu Cys Ser Glu Tyr Arg His Tyr Val Arg Asn 
565 570 575 

Gly Arg Leu Pro Cys Thr Arg Glu Asn Asp Pro lie Glu Gly Leu Asp 
580 585 590 
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Gly Lys lie His Gly Asn Thr Cys Ser Met Cys Glu Ala Phe Phe Gin 
595 600 605 

Gin Glu Ala Lys Glu Lys Glu Arg Ala Glu Pro Arg Ala Lys Val Lys 
610 615 620 

Arg Glu Ala Glu Lys Glu Thr Cys Asp Glu Phe Arg Arg Leu Leu Gin 
625 630 635 640 

Asn Gly Lys Leu Phe Cys Thr Arg Glu Asn Asp Pro Val Arg Gly Pro 
645 650 655 

Asp Gly Lys Thr His Gly Asn Lys Cys Ala Met Cys Lys Ala Val Phe 
660 665 670 

Gin Lys Glu Asn Glu Glu Arg Lys Arg Lys Glu Glu Glu Asp Gin Arg 
675 680 685 

Asn Ala Ala Gly His Gly Ser Ser Gly Gly Gly Gly Gly Asn Thr Gin 
690 . 695 700 

Asp Glu Cys Ala Glu Tyr Arg Glu Gin Met Lys Asn Gly Arg Leu Ser 
705 710 715 720 

Cys Thr Arg Glu Ser Asp Pro Val Arg Asp Ala Asp Gly Lys Ser Tyr 
725 730 735 

Asn Asn Gin Cys Thr Met Cys Lys Ala Lys Leu Glu Arg Glu Ala Glu 
740 745 750 

Arg Lys Asn Glu Tyr Ser Arg Ser Arg Ser Asn Gly Thr Gly Ser Glu 

755 760 765 

Ser Gly Lys Asp Thr Cys Asp Glu Phe Arg Ser Gin Met Lys Asn Gly 
770 775 780 

Lys Leu lie Cys Thr Arg Glu Ser Asp Pro Val Arg Gly Pro Asp Gly 
785 790 795 800 

Lys Thr His Gly Asn Lys Cys Thr Met Cys Lys Glu Lys Leu Glu Arg 
805 810 815 

Glu Ala Ala Glu Lys Lys Arg Lys Arg Met Lys Thr Gly Ala lie Gin 
820 825 830 

Glu Lys Gly Ala lie Gin Glu Lys Gly Ala Met Thr Lys Arg lie Cys 
835 840 845 

Val Val Asn Phe Glu Ala Cys Arg Glu Met Glu Ser Leu Ser Ala Pro 
850 855 860 

Glu Lys lie' Thr Leu Phe Glu Ala His Met Ala Arg Cys Thr Ser lie 
865 870 875 880 

Asn Val Leu Cys Val Arg Ala Ser Leu lie Glu Lys Leu Met Lys Glu 
885 890 895 

Lys Arg Lys Met Lys Arg Asn Gin Val Ala Ser Pro Gin lie Met Gin 
900 905 910 

Arg Met Ser Ala Val Asn Phe Glu Thr lie 
915 920 



» • 
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(2) ANGABEN ZU SEQ ID NO: 3: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 55 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Pep t id 



(xi) SEQUENZBESCHREIBUNG : SEQ ID 

Lys Asn Glu Asp Gin Glu Met Cys 
1 5 

Asn Gly Lys Leu Phe Cys Pro Gin 
20 

Asp Gly lie Met Phe lie Asn Lys 
35 40 

Glu Lys Glu Ala Lys Ser Gin 
50 55 

(2) ANGABEN ZU SEQ ID NO : 4: 

( i ) S EQUENZKENNZE I CHEN : 

(A) LANGE: 68 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



NO: 3 : 

His Glu Phe Gin Ala Phe Met Lys 
10 15 

Asp Lys Lys Phe Phe Gin Ser Leu 
25 30 

Cys Ala Thr Cys Lys Met lie Leu 
45 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 4: 

Glu Ser Gly Lys Ala Thr Ser Tyr Ala Glu Leu Cys Asn Glu Tyr Arg 
15 10 15 

Lys Leu Val Arg Asn Gly Lys Leu Ala Cys Thr Arg Glu Asn Asp Pro 
20 25 30 

lie Gin Gly Pro Asp Gly Lys Val His Gly Asn Thr Cys Ser Met Cys 
35 40 45 

Glu Val Phe Phe Gin Ala Glu Glu Glu Glu Lys Lys Lys Lys Glu Gly 
50 55 60 

Glu Ser Arg Asn 
65 

(2) ANGABEN ZU SEQ ID NO: 5: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 748 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 



(ii) 



ART DES MOLEKULS : cDNA 



• •« 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 5: 

ATGCATGGAG TGGACCTGTA GGCGACTTGC ATCGTCTTCA ACATGAAGAT AGCCACAGTG 60 

TCAGTGCTTC TGCCCTTGGC TCTTTGCCTC ATACAAGATG CTGCCAGTAA GAATGAAGAT 12 0 

CAGGAAATGT GCCATGAATT TCAGGCATTT ATGAAAAATG GAAAACTGTT CTGTCCCCAG 180 

GATAAGAAAT TTTTTCAAAG TCTTGATGGA ATAATGTTCA TCAATAAATG TGCCACGTGC 24 0 

AAAATGATAC TGGAAAAAGA AGCAAAATCA CAGAAGAGGG CCAGGCATTT AGCAAGAGCT 3 00 

CCCAAGGCTA CTGCCCCAAC AGAGCTGAAT TGTGATGATT TTAAAAAAGG AGAAAGAGAT 3 60 

GGGGATTTTA TCTGTCCTGA TTATTATGAA GCTGTTTGTG GCACAGATGG GAAAACATAT 42 0 

GACAACAGAT GTGCACTGTG TGCTGAGAAT GCGAAAACCG GGTCCCAAAT TGGTGTAAAA 4 80 

AGTGAAGGGG AATGTAAGAG CAGTAATCCA GAGCAGGTGA GGTCAATTGT CAGCCTGATG 54 0 

GGAAATACTG GGAGGCTAAC TTCAAATAGT AAGTAGGTGC TGTCCTCTTC CTTCTTAGGT 6 00 

GGGAGCCTTG GAAGGAATTA ATTCTTGCTT TATGTGAAAT GGAATACCCA GTTACTGCCC ' 660 

ACTAATATGA AAAAGCTAAT TATAGTCTCT GAAACTGGAT CAGATTACTT TGGTGGTTAA 72 0 

GATCTTTCAA TCTATTGCTG CTTTGTAT 74 8 
(2) ANGABEN ZU SEQ ID NO: 6: 

( i ) S EQUENZ KENN Z E I CHEN : 

(A) LANGE : 3 531 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: cDNA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 6: 

ATGCATGGAG TGGACCTGTA GGCGACTTGC ATCGTCTTCA ACATGAAGAT AGCCACAGTG 60 

TCAGTGCTTC TGCCCTTGGC TCTTTGCCTC ATACAAGATG CTGCCAGTAA GAATGAAGAT 120 

CAGGAAATGT GCCATGAATT TCAGGCATTT ATGAAAAATG GAAAACTGTT CTGTCCCCAG 180 

GATAAGAAAT TTTTTCAAAG TCTTGATGGA ATAATGTTCA TCAATAAATG TGCCACGTGC 24 0 

AAAATGATAC TGGAAAAAGA AGCAAAATCA CAGAAGAGGG CCAGGCATTT AGCAAGAGCT 3 00 

CCCAAGGCTA CTGCCCCAAC AGAGCTGAAT TGTGATGATT TTAAAAAAGG AGAAAGAGAT 3 60 

GGGGATTTTA TCTGTCCTGA TTATTATGAA GCTGTTTGTG GCACAGATGG GAAAACATAT 42 0 

GACAACAGAT GTGCACTGTG TGCTGAGAAT GCGAAAACCG GGTCCCAAAT TGGTGTAAAA 4 80 

AGTGAAGGGG AATGTAAGAG CAGTAATCCA GAGCAGGATG TATGCAGTGC TTTTCGGCCC 54 0 

TTTGTTAGAA ATGGAAGACT TGGATGCACA AGGGAAAATG ATCCTGTTCT TGGTCCTGAT 6 00 

GGGAAGACGC ATGGCAATAA GTGTGCAATG TGTGCTGAGC TGTTTTTAAA AGAAGCTGAA 66 0 
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AATGCCAAGC GAGAGGGTGA AACTAGAATT CGACGAAATG CTGAAAAGGA TTTTTGCAAG 72 0 

GAATATGAAA AACAAGTGAG AAATGGAAGG CTTTTTTGTA CACGGGAGAG TGATCCAGTC 78 0 

CGTGGCCCTG ACGGCAGGAT GCATGGCAAC AAATGTGCCC TGTGTGCTGA AATTTTCAAG 84 0 

CGGCGTTTTT CAGAGGAAAA CAGTAAAACA GATCAAAATT TGGGAAAAGC TGAAGAAAAA 900 

ACTAAAGTTA AAAGAGAAAT TGTGAAACTC TGCAGTCAAT ATCAAAATCA GGCAAAGAAT 96 0 

GGAATACTTT TCTGTACCAG AGAAAATGAC CCTATTCGTG GTCCAGATGG GAAAATGCAT 102 0 

GGCAACTTGT GTTCCATGTG TCAAGTCTAC TTCCAAGCAG AAAATGAAGA AAAGAAAAAG 10 8 0 

GCTGAAGCAC GAGCTAGAAA CAAAAGAGAA TCTGGAAAAG CAACCTCATA TGCAGAGCTT 114 0 

TGCAATGAAT ATCGAAAGCT TGTGAGGAAC GGAAAACTTG CTTGCACCAG AGAGAACGAT 12 00 

CCTATTCAGG GCCCAGATGG GAAAGTGCAC GGCAACACCT GCTCCATGTG TGAGGTTTTT 12 6 0 

TTCCAAGCAG AAGAAGAAGA AAAGAAAAAG AAGGAAGGCG AATCAAGAAA CAAAAGACAA 132 0 

TCTAAGAGTA CAGCTTCCTT TGAGGAGTTG TGTAGTGAAT ACCGCAAATC CAGGAAAAAC 13 8 0 

GGACGGCTTT TTTGCACCAG AGAGAATGAC CCCATCCAGG GCCCAGATGG GAAAATGCAT 14 4 0 

GGCAACACCT GCTCCATGTG TGAGGCCTTC ■ TTTCAACAAG AAGAAAGAGC AAGAGCAAAG 1500 

GCTAAAAGAG AAGCTGCAAA GGAAATCTGC AGTGAATTTC GGGACCAAGT GAGGAATGGA 156 0 

ACACTTATAT GCACCAGGGA GCATAATCCT GTCCGTGGAC CAGATGGCAA AATGCATGGA 162 0 

AACAAGTGTG CCATGTGTGC C AGTGTGTT C AAACTTGAAG AAGAAGAGAA GAAAAATGAT 1680 

AAAGAAGAAA AAGGGAAAGT TGAGGCTGAA AAAGTTAAGA GAGAAGCAGT TCAGGAGCTG 174 0 

TGCAGTGAAT ATCGTCATTA TGTGAGGAAT GGACGACTCC CCTGTACCAG AGAGAATGAT 1800 

CCTATTGAGG GTCTAGATGG GAAAATCCAC GGCAACACCT GCTCCATGTG TGAAGCCTTC 1860 

TTCCAGCAAG AAGCAAAAGA AAAAGAAAGA GCTGAACCCA GAGCAAAAGT CAAAAGAGAA 192 0 

GCTGAAAAGG AGACATGCGA TGAATTTCGG AGACTTTTGC AAAATGGAAA ACTTTTCTGC 1980 

^ACAAGAGAAA ATGATCCTGT GCGTGGCCCA GATGGCAAGA CCCATGGCAA CAAGTGTGCC 2 04 0 

ATGTGTAAGG CAGTCTTCCA GAAAGAAAAT GAGGAAAGAA AGAGGAAAGA AGAGGAAGAT 2100 

CAGAGAAATG CTGCAGGACA TGGTTCCAGT GGTGGTGGAG GAGGAAACAC TCAGGACGAA 2160 

TGTGCTGAGT ATCGGGAACA AATGAAAAAT GGAAGACTCA GCTGTACTCG GGAGAGTGAT 2 22 0 

CCTGTACGTG ATGCTGATGG CAAATCGTAC AACAATCAGT GTACCATGTG TAAAGCAAAA 22 80 

TTGGAAAGAG AAGCAGAGAG AAAAAATGAG TATTCTCGCT CCAGATCAAA TGGGACTGGA 2 34 0 

TCAGAATCAG GGAAGGATAC ATGTGATGAG TTTAGAAGCC AAATGAAAAA TGGAAAACTT 24 00 

ATCTGCACTC GAGAAAGTGA CCCTGTCCGG GGTCCAGATG G C AAG AC AC A TGGTAATAAG 24 6 0 

TGTACTATGT GTAAGGAAAA ACTGGAAAGG GAAGCAGCTG AAAAAAAAAG AAAGAGGATG 2 52 0 

AAGACAGGAG CAATACAGGA G AAAGG AG C A ATACAGGAGA AAGGAGCAAT GACAAAGAGG 2 580 

ATCTGTGTCG TGAATTTCGA AGCATGCAGA GAAATGGAAA GCTTATCTGC AC C AG AG AAA 2 64 0 

ATAACCCTGT TCGAGGCCCA TATGGCAAGA TGCACATCAA TAAATGTGCT ATGTGTCAGA 2 700 



• • • • • • 
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GCATCTTTGA TCGAGAAGCT AATGAAAGAA AAAAGAAAGA TGAAGAGAAA TCAAGTAGCA 2 760 

AGCCCTCAAA TAATGCAAAG GATGAGTGCA GTGAATTTCG AAACTATATA AGGAACAATG 2 82 0 

AACTCATCTG CCCTAGAGAG AATG AC C C AG TGCACGGTGC TGATGGAAAG TTCTATACAA 2 8 80 

ACAAGTGCTA CATGTGCAGA GCTGTCTTTC TAACAGAAGC TTTGGAAAGG GCAAAGCTTC 2 94 0 

AAGAAAAACC ATCCCATGTT AGAGCTTCTC AAGAGGAAGA CAGCCCAGAC TCTTTCAGTT 3 0 00 

CTCTGGATTC TGAGATGTGC AAAGACTACC GAGTATTGCC CAGGATAGGC TATCTTTGTC 3 0 60 

CAAAGGATTT AAAGCCTGTC TGTGGTGACG ATGGCCAAAC CTACAACAAT CCTTGCATGC 312 0 

TCTGTCATGA AAACCTGATA CGCCAAACAA ATACACACAT CCGCAGTACA GGGAAGTGTG 3180 

AGG AG AG C AG CACCCCAGGA ACCACCGCAG CCAGCATGCC CCCGTTTGAC GAATGACAGG 3 24 0 

AAGATTGTTG AAAGCCATGA GGGAAAAAAT AAACCCCAGT TTTGAATCAC CTACCTTCAC 3300 

CATCTGTATA TACAAAGAAT TTTTCGGAGC TTGTTTTATT TGCTATAGAA AACAATACAG 3 3 60 

AGCTTTTGGG AATGGAATCA CTGATTTTCA GTCTTTTCCA TTTCTTTCCT CCTAGAATCT 3 42 0 

GTGATCTGAG GGTATAAAGA CATTTCCACC AAGTTTGAGC CCTCAAAATG TCCTGATTAC 3 480 

AATGCTGTCT GTCCAACTGC CTGTTCAATA AAAGTAAACT CAGCAGAAAA A 3 531 
(2) ANGABEN ZU SEQ ID NO : 7 : 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART; Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS; Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 7: 

His Glu Phe Gin Ala Phe Met Lys Asn Gly Lys Leu Phe 
15 10 

(2) ANGABEN ZU SEQ ID NO : 8: 

( i ) S EQUENZ KENNZ EI CHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 8: 

Ser Glu Tyr Arg Lys Ser Arg Lys Asn Gly Arg Leu Phe 
1 5 io 




(2) ANGABEN ZU SEQ ID NO: 9: 

( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: 

Asp Asp Phe Lys Lys Gly Glu Arg Asp Gly Asp Phe lie 
15 10 

(2) ANGABEN ZU SEQ ID NO: 10: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: 

Ser Glu Phe Arg Asp Gin Val Arg Asn Gly Thr Leu lie 
15 10 

(2) ANGABEN ZU SEQ ID NO: 11: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 

Ser Ala Phe Arg Pro Phe Val Arg Asn Gly Arg Leu Gly 
15 10 

(2) ANGABEN ZU SEQ ID NO: 12: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE : 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 

Ser Glu Tyr Arg His Tyr Val Arg Asn Gly Arg Leu Pro 
15 10 

(2) ANGABEN ZU SEQ ID NO: 13: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 13: 

Lys Glu Tyr Glu Lys Gin Val Arg Asn Gly Arg Leu Phe 
15 10 

(2) ANGABEN ZU SEQ ID NO: 14: 

( i ) S EQUENZ KENNZ EI CHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: 

Asp Glu Phe Arg Arg Leu Leu Gin Asn Gly Lys Leu Phe 
15 10 

(2) ANGABEN ZU SEQ ID NO: 15: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART : Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 15: 

Ser Gin Tyr Gin Asn Gin Ala Lys Asn Gly lie Leu Phe 
15 10 

(2) ANGABEN ZU SEQ ID NO: 16: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 




(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 16: 

Ala Glu Tyr Arg Glu Gin Met Lys Asn Gly Arg Leu Ser 
15 10 

(2) ANGABEN ZU SEQ ID NO: 17: 

( i ) S EQUENZ KENN Z E I CHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 17: 

Asn Glu Tyr Arg Lys Leu Val Arg Asn Gly Lys Leu Ala 
15 10 

(2) ANGABEN ZU SEQ ID NO: 18: 

( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 13 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 18: 

Asp Glu Phe Arg Ser Gin Met Lys Asn Gly Lys Leu lie 
15 10 

(2) ANGABEN ZU SEQ ID NO: 19: 

( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE : 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 19: 

Pro Gin Asp Lys Lys Phe Phe Gin Ser Leu Asp Gly lie Met Phe lie 
15 10 15 

Asn Lys 




(2) ANGABEN ZU SEQ ID NO: 20: 



( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE : 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 



(ii) ART DES MOLEKULS: Pep t id 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 20: 

Thr Arg Glu Asn Asp Pro lie Gin Gly Pro Asp Gly Lys Met His Gly 
15 10 15 

Asn Thr 



(2) ANGABEN ZU SEQ ID NO: 21: 

( i } S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Pep t id 



(xi) S EQUENZ BESCHRJE I BUNG : SEQ ID NO: 21: 

Thr Arg Glu Asn Asp Pro Val Leu Gly Pro Asp Gly Lys Thr His Gly 
15 10 15 

Asn Lys 



(2) ANGABEN ZU SEQ ID NO: 22: 

( i ) S EQUENZ KENN Z E I CHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 22: 

Thr Arg Glu His Asn Pro Val Arg Gly Pro Asp Gly Lys Met His Gly 
15 10 15 

Asn Lys 




(2) ANGABEN ZU SEQ ID NO: 23: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Pep t id 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 23: 

Thr Arg Glu Ser Asp Pro Val Arg Gly Pro Asp Gly Arg Met His Gly 
1 5 10 15 

Asn Lys 



(2) ANGABEN ZU SEQ ID NO: 24: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Pep t id 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 24: 

Thr Arg Glu Asn Asp Pro lie Glu Gly Leu Asp Gly Lys lie His Gly 
15 10 15 

Asn Thr 



(2) ANGABEN ZU SEQ ID NO : 25: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 18 Aminosauren 

( B ) ART : Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Pep t id 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 25: 

Thr Arg Glu Asn Asp Pro lie Arg Gly Pro Asp Gly Lys Met His Gly 

15 10 15 

Asn Leu 
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(2) ANGABEN ZU SEQ ID NO: 26: 



( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 18 Aminosauren 

( B ) ART : Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 26: 

Thr Arg Glu Asn Asp Pro Val Arg Gly Pro Asp Gly Lys Thr His Gly 
1 5 10 15 

Asn Lys 

(2) ANGABEN ZU SEQ ID NO: 27: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 27: 

Thr Arg Glu Asn Asp Pro lie Gin Gly Pro Asp Gly Lys Val His Gly 

1 5 io 15 

Asn Thr 



(2) ANGABEN ZU SEQ ID NO: 28: 

( i ) S EQUENZ KENNZ EI CHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 28: 

Thr Arg Glu Ser Asp Pro Val Arg Asp Ala Asp Gly Lys Ser Tyr Asn 
1 5* io 15 

Asn Gin 




(2) ANGABEN ZU SEQ ID NO:. 29: 

( i ) S EQUENZ KENNZ EI CHEN : 

(A) LANGE: 18 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Pep t id 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 29: 

Thr Arg Glu Ser Asp Pro Val Arg Gly Pro Asp Gly Lys Thr His Gly 
15 10 15 

Asn Lys 



(2) ANGABEN ZU SEQ ID NO: 30: 

( i ) S EQUENZ KENNZ E I CH EN : 

(A) LANGE : 2 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 30: 

Ala Thr 
1 

(2) ANGABEN ZU SEQ ID NO : 31: 

( i ) S EQUENZ KENN Z E I CHEN : 

(A) LANGE : 2 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 31: 

Ala Leu 

1 

(2) ANGABEN ZU SEQ ID NO: 32: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 2 Aminosauren 

(B) ART: Aminosaure 

(C) STRANGFORM: Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 32: 

Ala Met 
1 

(2) ANGABEN ZU SEQ ID NO: 33: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE : 2 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS : Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 33: 

Ser Met 
1 

(2) ANGABEN ZU SEQ ID NO: 34: 

( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE : 2 Aminosauren 

(B) ART: Aminosaure 

(C) STRANG FORM : Einzelstrang 

(D) TOPOLOGIE: nicht bekannt 

(ii) ART DES MOLEKULS: Peptid 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 34: 

Thr Met 
1 
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Anspruche 



1. Serin-Proteinase- Inhibitor , dadurch gekennzeichnet , dafi 
der Serin-Proteinase-Inhibitor eine Domane mit vier 
Cysteinen aufweist und sich zwischen einem ersten und 
einem zweiten Cystein eine Sequenz von 0 bis 20 Amino- 
sauren befindet oder der Serin-Proteinase-Inhibitor 
eine Domane mit sechs Cysteinen aufweist und sich 
zwischen einem ersten und zweiten Cystein eine Sequenz 
von 7 bis 20 Aminosauren befindet. 



2. Serin-Proteinase-Inhibitor gemaiS Anspruch 1, dadurch 
gekennzeichnet, da£ sich zwischen dem ersten und dem 
zweiten Cystein der Domane eine Sequenz von 13 Amino- 
sauren befindet. 



3. Serin-Proteinase-Inhibitor gemaS Anspruch 1 und/oder 
2, dadurch gekennzeichnet, daS sich zwischen dem 
zweiten und dem dritten Cystein der Domane eine Sequenz 
von 18 Aminosauren befindet. 



4. Serin-Proteinase-Inhibitor gema£ einem der Anspruche 

1 bis 3, dadurch gekennzeichnet, da£ sich zwischen dem 
dritten und vierten Cystein der Domane eine Sequenz von 

2 Aminosauren befindet. 



5. Serin-Proteinase-Inhibitor gemaS einem der Anspruche 
1 bis 4, dadurch gekennzeichnet, daS die Sequenz der 
Domane zwischen dem ersten und dem zweiten Cystein 
ausgewahlt wird aus 



HE FQAFMKNGKLF , 
DDFKKGERDGDF I , 
SAFRPFVRNGRLG , 
KE YEKQVRNGRLF , 
SQYQNQAKNGILF, 



SEYRKSRKNGRLF , 
S E FRDQVRNGTL I , 
S E YRH YVRNGRL P , 
DEFRRLLQNGKLF, 
AEYREQMKNGRLS oder 



NE YRKLVRNGKLA , 



DE FRSQMKNGKL I . 



Serin-Proteinase- Inhibitor gemaE einem der Anspruche 
1 bis 5, dadurch gekennzeichnet , daS die Sequenz zwi- 
schen dem zweiten und dem dritten Cystein der Domane 
ausgewahlt wird aus 



TRESDPVRGPDGKTHGNK . 

Serin-Proteinase- Inhibitor gemaS einem der Anspruche 
1 bis 6, dadurch gekennzeichnet, da£ die Sequenz 
zwischen dem dritten und dem vierten Cystein der Domane 
ausgewahlt wird aus 

AT, AL, AM, SM oder TM. 

Serin-Proteinase-Inhibitor gemaS einem der Anspruche 
1 bis 7, mit einer der Formeln 

Ri-C-HE FQAFMKNGKLF - C - PQDKKF FQS LDG I MF I NK - C - AT - C - R 2 
R x - C - DDFKKGERDGDF I - C - PD YYEAVCGTDGKT YDNR -C-AL-C-R 2 
R x - C - S AFRP F VRNGRLG - C - TRENDP VLGPDGKTHGNK -C-AM-C-R 2 
Ri - C - KE YEKQVRNGRLF - C - TRE S D P VRG P DGRMHGNK - C - AL - C - R 2 
R x -C- SQYQNQAKNG ILF-C- TRENDP I RGPDGKMHGNL - C - SM - C - R 2 
R x - C - NE YRKLVRNGKLA- C - TRENDP I QGPDGKVHGNT - C - SM - C - R 2 
R-l - C - SE YRKSRKNGRLF - C - TRENDP I QGPDGKMHGNT - C - SM - C - R 2 
R x - C - SE FRDQVRNGTL I - C - TREHNP VRGPDGKMHGNK -C-AM-C-R 2 
R x - C - SE YRHYVRNGRLP - C - TREND P I EGLDGK IHGNT - C - SM - C - R 2 
Ri - C - DEFRRLLQNGKLF - C - TRENDP VRGPDGKTHGNK -C-AM-C-R 2 
R x - C - AE YREQMKNGRLS - C - TRESDPVRDADGKS YNNQ - C - TM - C - R 2 
R x - C - DEFRSQMKNGKL I - C - TRESDPVRGPDGKTHGNK - C - TM - C - R 2 , 



PQDKKFFQSLDGIMFINK , 
TRENDPVLGPDGKTHGNK , 
TRESDPVRGPDGRMHGNK , 
TRENDP I RGPDGKMHGNL , 
TRENDP IQGPDGKVHGNT, 



TRESDPVRDADGKS YNNQ oder 



TRENDPIQGPDGKMHGNT, 
TREHNPVRGPDGKMHGNK , 
TREND P I EGLDGKI HGNT , 
TRENDP VRGPDGKTHGNK , 
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worin R x NH 2 , eine Aminosaure oder ein Peptid mit bis 
zu 1.000 Aminosauren ist und R 2 COOH, CONH 2 , eine Amino- 
saure oder ein Peptid mit bis zu 1.000 Aminosauren ist. 

9. Serin-Proteinase-Inhibitor gemaS mindestens einem der 
Anspriiche 1 bis 8, dadurch gekennzeichnet, daS 

er zwischen dem ersten und dem vierten Cystein 
und/oder dem zweiten und dem dritten Cystein eine 
Disulf idbriicke aufweist oder 

er zwischen dem ersten und dem fvinften und/oder 
dem zweiten und dem vierten und/oder dem dritten 
und dem sechsten Cystein eine Disulf idbriicke 
aufweist . 

10. Serin-Proteinase-Inhibitor gemaS mindestens einem der 
Anspriiche 1 bis 9, dadurch gekennzeichnet , daS es sich 
urn ein Fragment von VAKTI-1 (Seq. ID Nr. 1) oder VAKTI - 
2 (Seq. ID Nr. 2) handelt . 

11. Serin-Proteinase-Inhibitor gemafi Anspruch 10, dadurch 
gekennzeichnet, daS es sich urn HF 6479 (Seq. ID Nr. 3) 
oder HF 7665 (Seq. ID Nr. 4) handelt. 

12. Nucleinsaure, kodierend fur einen Serin-Proteinase-In- 
hibitor gemaS mindestens einem der Anspriiche 1 bis 11. 

13. Arzneimittel enthaltend mindestens einen Serin- 
Proteinase-Inhibitor gemaS mindestens einem der Ansp- 
riiche 1 bis 11 und/oder eine Nucleinsaure gemaS An- 
spruch 12 gegebenenf alls mit pharmazeut ischen Trager- 
stof f en . 

14. Arzneimittel nach Anspruch 13, enthaltend 0,01 bis 
1.00 0 mg/kg Korpergewicht des Serin- Proteinase -Inhibi- 
tors nach mindestens einem der Anspriiche 1 bis 11 
und/oder der Nucleinsaure gemaS Anspruch 12. 
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15. Verwendung des Serin- Proteinase - Inbibitors nach 
mindestens einem der Anspriiche 1 bis 11 zur Herstellung 
eines Arzneimittels zur Behandlung von akuten oder 
chronischen Cervixent zundungen , Entziindungen der 
Bartholinschen Driisen und anderer vaginaler Bereiche, 
Tonsillitis, Pharyngitis und Laryngitis, mit exzessiver 
Schleimbildung verbundener akut oder chronisch entziind- 
licher Prozesse und sich daraus ergebender akuter 
Notsituationen, postoperativer Blutungen aufgrund 
Hyperf ibrinolyse sowie zur Prophylaxe der Lungen- 
emphysembildung bei ^-Proteinase- Inhibi tormangel . 

16 . Verwendung der Nucleinsauren gemaS Anspruch 12 zur 
Herstellung eines Arzneimittels zum Einsatz in der 
Gentherapie zur Heilung und Prophylaxe von Erkrankungen 
gemaS Anspruch 12 . 

17. Antikorper oder Antikorper-Fragmente gegen Epitope der 
Verbindungen nach einem der Anspruche 1 bis 11. 

18. Poly- oder Oligonucleotide, die mit Bereichen der cDNA 
oder entsprechender RNA unter. stringenten Bedingungen 
hybridisieren und gegebenenf alls die Expression 
codierender Bereiche der fur die Verbindungen nach 
Anspruch 1 bis 11 codierenden Gene verhindern (Anti- 
sense Verbindungen) . 

19. Diagnostikum enthaltend mindestens eine der Verbin- 
dungen gemaS Anspruch 17 oder 18. 

20. Arzneimittel enthaltend mindestens eine der in den 
Anspruchen 17 und/oder 18 genannten Verbindungen in 
therapeut isch wirksamen Mengen. 

21. Verwendung der Verbindungen gemaS Anspruch 17 und/oder 
18 zur Herstellung eines Arzneimittels zur Behandlung 
von Erkrankungen, die mit einer zu hohen Expression der 
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Verbindungen gemaS mindestens einem der Anspriiche 1 bis 
11 oder zu hohen Aktivitat der fur die Verbindungen 
gemaS Anspriichen 1 bis 11 codierenden Bereichen ver- 
bunden sind. 

22. DNA kodierend fur die in den Anspriichen 1 bis 11 ge- 
nannten Verbindungen und/oder RNA, die in der 
Transcription oder Translation der in den Anspriichen 
1 bis 11 genannten Verbindungen beteiligt ist. 

23. DNA gemafi Anspruch 22 mit der Seq. ID Nr. 5 oder Seq. 
ID Nr. 6. 



Zusammen fas sung 



Serin-Proteinase-Inhibitor, dadurch gekennzeichnet, da£ der 
Serin-Proteinase-Inhibitor eine Domane mit vier Cysteinen 
aufweist und sich zwischen einem ersten und einem zweiten 
Cystein eine Sequenz von 0 bis 2 0 Aminosauren befindet oder 
der Serin-Proteinase-Inhibitor eine Domane mit sechs Cystei- 
nen aufweist und sich zwischen einem ersten und zweiten 
Cystein eine Sequenz von 7 bis 20 Aminosauren befindet. 



1/6 
Figur 1 

VAKTI-1 cDNA und Translation in Amino sauresequenz 

Frame 2 M K I A 

ATG CAT GGA GTG GAC CTG TAG GCG ACT TGC ATC GTC TTC AAC ATG AAG ATA GCC 
10 19 28 37 46 55 

| MEMC-1— > 

|->HF6479 

TVS V L L P LALCL I Q D A A S |K N 
ACA GTG TCA GTG CTT CTG CCC TTG GCT CTT TGC CTC ATA CAA GAT GCT GCC AGT AAG AAT 
64 73 82 91 100 109 



-MEMC-1 > CHEF-1- 



EDQEMCHEFQAFMKNGKLFC 
GAA GAT CAG GAA ATG TGC CAT GAA TTT CAG GCA TTT ATG AAA AAT GGA AAA CTG TTC TGT 
124 133 142 151 160 169 



-CHEF- 14 

-CHEF- 11 > < CHEF-2- 



PQDKKFFQSLDGIMFINKCA 
CCC CAG GAT AAG AAA TTT TTT CAA AGT CTT GAT GGA ATA ATG TTC ATC AAT AAA TGT GCC 
184 193 202 211 220 229 




HEF-2 HF6479 < 1 

C KM I L E KE AKS Q | K R A RH LA 

ACG TGC AAA ATG ATA CTG GAA AAA GAA GCA AAA TCA CAG AAG AGG GCC AGG CAT TTA GCA 
244 253 262 271 280 289 

RAPKATAPTELNC DDFKKGE 
AGA GCT CCC AAG GCT ACT GCC CCA ACA GAG CTG AAT TGT GAT GAT TTT AAA AAA GGA GAA 
304 313 322 331 340 349 

RDGD FICPDYYEAVCGTDGK 
AGA GAT GGG GAT TTT ATC TGT CCT GAT TAT TAT GAA GCT GTT TGT GGC ACA GAT GGG AAA 
364 373 382 391 400 409 

TYDNRCALCAENAKTGSQIG 
ACA TAT GAC AAC AGA TGT GCA CTG TGT GCT GAG AAT GCG AAA ACC GGG TCC CAA ATT GGT 
424 433 442 451 460 469 

VKSEGECKSSNPEQVRSIVS 




GTA AAA AGT GAA GGG GAA TGT AAG AGC AGT AAT CCA GAG CAG GTG AGG TCA ATT GTC AGC 
484 493 502 511 520 529 

MGNT GRLTSNSK STOP 

ATG GGA AAT ACT GGG AGG CTA ACT TCA AAT AGT AAG TAG GTG CTG TCC TCT TCC TTC 
544 553 562 571 580 589 

TTA GGT GGG AGC CTT GGA AGG AAT TAA TTC TTG CTT TAT GTG AAA TGG AAT ACC CAG TTA 
604 613 622 631 640 649 

CTG CCC ACT AAT ATG AAA AAG CTA ATT ATA GTC TCT GAA ACT GGA TCA GAT TAC TTT GGT 
664 673 682 691 700 709 



GGT TAA GAT CTT TCA ATC TAT TGC TGC TTT GTA T 
724 733 742 749 



t ♦ ♦ • • » 
> • # 
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Figur 2 2 / 6 

VAKTI-2 cDNA unci Translation in Amino sauresequenz 

Frame 2 M K I A 

ATG CAT GGA GTG GAC CTG TAG GCG ACT TGC ATC GTC TTC AAC ATG AAG ATA GCC 
10 19 28 37 46 55 

I > HF 6479 

TVSVLLPLALCLIQDAASIKN 
ACA GTG TCA GTG CTT CTG CCC TTG GCT CTT TGC CTC ATA CAA GAT GCT GCC AGT AAG AAT 
64 73 82 91 100 109 

Repeat 1 



EDQEMCHEFQAFMKNGKLFC 
GAA GAT CAG GAA ATG TGC CAT GAA TTT CAG GCA TTT ATG AAA AAT GGA AAA CTG TTC TGT 

124 133 142 151 160 169 

# 

PQDKKFFQSLDGIMFINKCA 
CCC CAG GAT AAG AAA TTT TTT CAA AGT CTT GAT GGA ATA ATG TTC ATC AAT AAA TGT GCC 

184 193 202 211 220 229 

* HF 6479 < | 

T C K M I LEKEAKSQIKRARHLA 
G TGC AAA ATG ATA CTG GAA AAA GAA GCA AAA TCA CAG AAG AGG GCC AGG CAT TTA GCA 
244 253 262 271 280 289 



Typische Kazal-Domane 



R 

AGA 


A 

GCT 


P 

CCC 
304 


K 

AAG 


A 

GCT 


T 

ACT 
313 


A 

GCC 
# 


P 

CCA 


T 

ACA 
322 


E 

GAG 


L 

CTG 


N 

AAT 
331 


C 

TGT 


D 

GAT 


D 

GAT 
340 
+ 


F 

TTT 


K 

AAA 


K 

AAA 
349 


G 

GGA 


E 

GAA 


R 

AGA 


D 

GAT 
i 


G 

GGG 

364 


D 

GAT 


F 

TTT 


I 

ATC 
373 
# 


C 

TGT 


P 

CCT 


D 

GAT 

382 
+ 


Y 

TAT 


Y 

TAT 


E 

GAA 

391 


A 

GCT 


V 

GTT 


C 

TGT 
400 


G 

GGC 


T 

ACA 


D 

GAT 
409 


G 

GGG 


K 

AAA 


T 

ACA 


Y 

TAT 


D 

GAC 
424 


N 

AAC 


R 

AGA 


C 

TGT 

433 


A 

GCA 


L 

CTG 


C 

TGT 
442 


A 

GCT 


E 

GAG 


N 

AAT 
451 


A 

GCG 


K 

AAA 


T 

ACC 
460 


G 

GGG 


S 

TCC 


Q 

CAA 
469 


I 

ATT 


G 

GGT 














+ 




















Repeat 2 
* 




V 

GTA 


K 

AAA 


S 

AGT 
484 


E 

GAA 


G 

GGG 


E 

GAA 
493 


C 

TGT 


K 

AAG 


S 

AGC 
502 


S 

AGT 


N 

AAT 
# 


P 

CCA 
511 


E 

GAG 


Q 

CAG 


D 

GAT 
520 


V 

GTA 


C 

TGC 


S 

AGT 
529 


A 

GCT 


F 

TTT 


1 


P 

CCC 


F 

TTT 
544 


V 

GTT 


R 

AGA 


N 

AAT 
553 


G 

GGA 


R 

AGA 


L 

CTT 
562 


G 

GGA 
# 


C 

TGC 


T 

ACA 
571 


R 

AGG 
* 


E 

GAA 


N 

AAT 
580 


D 

GAT 


P 

CCT 


V 

GTT 
589 


L 

CTT 


G 

GGT 


CCT 


D 

GAT 


G 

GGG 
604 


K 

AAG 


T 

ACG 


H 

CAT 
613 


G 

GGC 


N 

AAT 


K 

AAG 
622 


C 

TGT 


A 

GCA 


M 

ATG 
631 


C 

TGT 


A 

GCT 


E 

GAG 
640 


L 

CTG 


F 

TTT 


L 

TTA 
649 


K 

AAA 


E 

GAA 


A 

GCT 


E 

GAA 


N 

AAT 
664 


A 

GCC 


K 

AAG 


R 

CGA 
673 


E 

GAG 


G 

GGT 


E 

GAA 
682 


T 

ACT 


R 

AGA 


I 

ATT 
691 


R 

CGA 


R 

CGA 


N 

AAT 
700 


A 

GCT 


E 

GAA 


K 

AAG 
709 


D 

GAT 


F 

TTT 


Repeat 3 
























# 












C 

TGC 


K 

AAG 


E 

GAA 
724 


Y 

TAT 


E 

GAA 


K 

AAA 
733 


Q 

CAA 


V 

GTG 


R 

AGA 
742 


N 

AAT 


G 

GGA 


R 

AGG 
751 


L 

CTT 


F 

TTT 
# 


C 

TGT 
760 


T 

ACA 


R 

CGG 
* 


E 

GAG 
769 


S 

AGT 


D 

GAT 


P 

CCA 


V 

GTC 


R 

CGT 
784 


G 

GGC 


P 

CCT 


D 

GAC 
793 


G 

GGC 


R 

AGG 


M 

ATG 
802 


H 

CAT 


G 

GGC 


N 

AAC 
811 


K 

AAA 


C 

TGT 


A 

GCC 
820 


L 

CTG 


C 

TGT 


A 

GCT 
829 


E 

GAA 


I 

ATT 



FKRRFSEENSKTDQNLGKAE 
TTC AAG CGG CGT TTT TCA GAG GAA AAC AGT AAA ACA GAT CAA AAT TTG GGA AAA GCT GAA 
844 853 862 871 880 889 
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Repeat 4 



EKTKVKRE IVKLCSQYQNQA 
GAA AAA ACT AAA GTT AAA AGA GAA ATT GTG AAA CTC TGC AGT CAA TAT CAA AAT CAG GCA 
904 913 922 931 940 949 

# 

KNGILFCTRENDPIRGPDGK 
AAG AAT GGA ATA CTT TTC TGT ACC AGA GAA AAT GAC CCT ATT CGT GGT CCA GAT GGG AAA 

964 973 982 991 1000 1009 
# * 

MHGNLCSMCQVYFQAENEEK 
ATG CAT GGC AAC TTG TGT TCC ATG TGT CAA GTC TAC TTC CAA GCA GAA AAT GAA GAA AAG 
1024 1033 1042 1051 1060 1069 



| > HF 7665 

K KAEARARNKRIESGKATSYA 
AAA AAG GCT GAA GCA CGA GCT AGA AAC AAA AGA GAA TCT GGA AAA GCA ACC TCA TAT GCA 
1084 1093 1102 1111 1120 1129 

Repeat 5 

# 



ELCN EYRKLVRNGKLACTRE 
GAG CTT TGC AAT GAA TAT CGA AAG CTT GTG AGG AAC GGA AAA CTT GCT TGC ACC AGA GAG 
1144 1153 1162 1171 1180 1189 

# * 

DPIQGPDGKVHGNTCSMCE 
GAT CCT ATT CAG GGC CCA GAT GGG AAA GTG CAC GGC AAC ACC TGC TCC ATG TGT GAG 
1204 1213 1222 1231 1240 1249 

HF 7665 < 1 

VFFQAEEEEKKKKEGESRN|K 
GTT TTT TTC CAA GCA GAA GAA GAA GAA AAG AAA AAG AAG GAA GGC GAA TCA AGA AAC AAA 
1264 1273 1282 1291 1300 1309 

Repeat 6 



RQSKSTAS FEELCSEYRKS R 
AGA CAA TCT AAG AGT ACA GCT TCC TTT GAG GAG TTG TGT AGT GAA TAC CGC AAA TCC AGG 

1324 1333 1342 1351 1360 1369 

# , „ 

KNGRLFCTRENDPIQGPDGK 
AAA AAC GGA CGG CTT TTT TGC ACC AGA GAG AAT GAC CCC ATC CAG GGC CCA GAT GGG AAA 

1384 1393 1402 1411 1420 1429 
# * 

MHGNTC S MCEAFFQQEERAR 
ATG CAT GGC AAC ACC TGC TCC ATG TGT GAG GCC TTC TTT CAA CAA GAA GAA AGA GCA AGA 
1444 1453 1462 1471 1480 1489 

Repeat 7 



KAKREAAKE I CSEFRDQVR 
GCA AAG GCT AAA AGA GAA GCT GCA AAG GAA ATC TGC AGT GAA TTT CGG GAC CAA GTG AGG 

1504 1513 1522 1531 1540 1549 

# 

NGTL I CTREHNPVRGPDGKM 
AAT GGA ACA CTT ATA TGC ACC AGG GAG CAT AAT CCT GTC CGT GGA CCA GAT GGC AAA ATG 

1564 1573 1582 1591 1600 1609 
# * 

HGNKCAMCASV FKLEEEEKK 
CAT GGA AAC AAG TGT GCC ATG TGT GCC AGT GTG TTC AAA CTT GAA GAA GAA GAG AAG AAA 
1624 1633 1642 1651 1660 1669 

N DK E E K G K V EAE KVKR E A V Q 
AAT GAT AAA GAA GAA AAA GGG AAA GTT GAG GCT GAA AAA GTT AAG AGA GAA GCA GTT CAG 
1684 1693 1702 1711 1720 1729 

Repeat 8 



ELCSEYRHYVRNGRLPCTRE 
GAG CTG TGC AGT GAA TAT CGT CAT TAT GTG AGG AAT GGA CGA CTC CCC TGT ACC AGA GAG 
1744 1753 1762 1771 1780 1789 
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# 

NDPIEGLDGKIHGNTCSM 
AAT GAT CCT ATT GAG GGT CTA GAT GGG AAA ATC CAC GGC AAC ACC TGC TCC ATG 
1804 1813 1822 1831 1840 1849 



C E 
TGT GAA 



AFFQQEAKEKERAEPRAKVK 
GCC TTC TTC CAG CAA GAA GCA AAA GAA AAA GAA AGA GCT GAA CCC AGA GCA AAA GTC AAA 
1864 1873 1882 1891 1900 1909 

Repeat 9 

R E A E K E T C D E F R R L L Q N G K L 

AGA GAA GCT GAA AAG GAG ACA TGC GAT GAA TTT CGG AGA CTT TTG CAA AAT GGA AAA CTT 
1924 1933 1942 1951 1960 1969 

# 

F C T R E N D P V R G P D G K T H G N K 
TTC TGC ACA AGA GAA AAT GAT CCT GTG CGT GGC CCA GAT GGC AAG ACC CAT GGC AAC AAG 
1984 1993 2002 2011 2020 2029 



CAMCKAV FQKENEERKRKEE 
TGT GCC ATG TGT AAG GCA GTC TTC CAG AAA GAA AAT GAG GAA AGA AAG AGG AAA GAA GAG 
2044 2053 2062 2071 2080 2089 



DQRNAAGHGSSGGGGGNTQ 
GAT CAG AGA AAT GCT GCA GGA CAT GGT TCC AGT GGT GGT GGA GGA GGA AAC ACT CAG 
2104 2113 2122 2131 2140 2149 

Repeat 10 

*- # 

DECAEYREQMKNGRLSCTRE 
GAC GAA TGT GCT GAG TAT CGG GAA CAA ATG AAA AAT GGA AGA CTC AGC TGT ACT CGG GAG 
2164 2173 2182 2191 2200 2209 

# * 

SDPVRDADGKSYNNQCTMCK 
AGT GAT CCT GTA CGT GAT GCT GAT GGC AAA TCG TAC AAC AAT CAG TGT ACC ATG TGT AAA 
2224 2233 2242 2251 2260 2269 



AKLEREAERKNEYSRSRSNG 
GCA AAA TTG GAA AGA GAA GCA GAG AGA AAA AAT GAG TAT TCT CGC TCC AGA TCA AAT GGG 
2284 2293 2302 2311 2320 2329 

Repeat 11 

GSESGKDT C D E F R S Q M K N~ G 
GGA TCA GAA TCA GGG AAG GAT ACA TGT GAT GAG TTT AGA AGC CAA ATG AAA AAT GGA 
2344 2353 2362 2371 2380 2389 

# 

K L I C T R E S D P V R G P D G K T H G 

hAA CTT ATC TGC ACT CGA GAA AGT GAC CCT GTC CGG GGT CCA GAT GGC AAG ACA CAT GGT 
2404 2413 2422 2431 2440 2449 

# * 

N KCTMCKEKLEREAAEKKRK 
AAT AAG TGT ACT ATG TGT AAG GAA AAA CTG GAA AGG GAA GCA GCT GAA AAA AAA AGA AAG 
2464 2473 2482 2491 2500 2509 



^MKTGAIQEKGAIQEKGAMT 
AGG ATG AAG ACA GGA GCA ATA CAG GAG AAA GGA GCA ATA CAG GAG AAA GGA GCA ATG ACA 
2524 2533 2542 2551 2560 2569 



" R I CVVN FEACREMESLSA P 
AAG AGG ATC TGT GTC GTG AAT TTC GAA GCA TGC AGA GAA ATG GAA AGC TTA TCT GCA CCA 
2584 2593 2602 2611 2620 2629 



• 4 • ♦ • • • 
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E K I T L F E A H MARC T S I NV LC 

GAG AAA ATA ACC CTG TTC GAG GCC. CAT ATG GCA AGA TGC ACA TCA ATA AAT GTG CTA TGT 
2644 2653 2662 2671 2680 2689 

VRAS L I E KLMKEKRKM'KRNQ 
GTC AGA GCA TCT TTG ATC GAG AAG CTA ATG AAA GAA AAA AGA AAG ATG AAG AGA AAT CAA 
2704 2713 2722 2731 2740 2749 

VAS PQIMQRMSA VNFETI STOP 
GTA GCA AGC CCT CAA ATA ATG CAA AGG ATG AGT GCA GTG AAT TTC GAA ACT ATA TAA GGA 
2764 2773 2782 2791 2800 2809 



ACA ATG AAC TCA TCT GCC CTA GAG AGA ATG ACC CAG TGC ACG GTG CTG ATG GAA AGT TCT 
2824 2833 2842 2851 2860 2869 



ATA CAA ACA AGT GCT ACA TGT GCA GAG CTG TCT TTC TAA CAG AAG CTT TGG AAA GGG CAA 
2884 2893 2902 2911 2920 2929 



TTC AAG AAA AAC CAT CCC ATG TTA GAG CTT CTC AAG AGG AAG ACA GCC CAG ACT CTT 
2944 2953 2962 2971 2980 2989 



TCA GTT CTC TGG ATT CTG AGA TGT GCA AAG ACT ACC GAG TAT TGC CCA GGA TAG GCT ATC 
3004 3013 3022 3031 3040 3049 



TTT GTC CAA AGG ATT TAA AGC CTG TCT GTG GTG ACG ATG GCC AAA CCT ACA ACA ATC CTT 
3064 3073 3082 3091 3100 3109 



GCA TGC TCT GTC ATG AAA ACC TGA TAC GCC AAA CAA ATA CAC ACA TCC GCA GTA CAG GGA 
3124 3133 3142 3151 3160 3169 



AGT GTG AGG AGA GCA GCA CCC CAG GAA CCA CCG CAG CCA GCA TGC CCC CGT TTG ACG AAT 
3184 3193 3202 3211 3220 3229 



AGG AAG ATT GTT GAA AGC CAT GAG GGA AAA AAT AAA CCC CAG TTT TGA ATC ACC TAC 
3244 3253 3262 3271 3280 3289 



CTT CAC CAT CTG TAT ATA CAA AGA ATT TTT CGG AGC TTG TTT TAT TTG CTA TAG AAA ACA 
3304 3313 3322 3331 3340 3349 



ATA CAG AGC TTT TGG GAA TGG AAT CAC TGA TTT TCA GTC TTT TCC ATT TCT TTC CTC CTA 
3364 3373 3382 3391 3400 3409 



GAA TCT GTG ATC TGA GGG TAT AAA GAC ATT TCC ACC AAG TTT GAG CCC TCA AAA TGT CCT 
3424 3433 3442 3451 3460 3469 

Polyadenylie rungs signal 

GAT TAC AAT GCT GTC TGT CCA ACT GCC TGT TC A ATA AAA GTA AAC TCA GCA GAA AAA. - . - 
3484 3493 3502 3511 3520 3529 



Poly (A) -Tail 



Figur 3 
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Trypsininhibition 



Zugsbevon HP 7665 



j rn=0,0596 



m =0,096 



10 Z ert in min 



